统计学是通过收集数据和分析数据来认识现象的一门科学。在现实生活中,我们往往无法调查每一个对象,因此需要通过“抽样”来以偏概全,实现科学推断。
1. Istilah Utama dalam Penyelidikan Statistik
- Penyelidikan Komprehensif (Sensus): Metode yang menyelidiki setiap objek penyelidikan.
- Penyelidikan Sampel (Sampling Survey): Mengambil sebagian individu dari populasi untuk diselidiki, lalu memperkirakan dan menarik kesimpulan tentang kondisi populasi berdasarkan hasil tersebut.
- Populasi (Population): Semua objek yang diselidiki.
- Individu (Individual): Setiap objek penyelidikan yang membentuk populasi.
- Sampel (Sample): Sebagian individu yang diambil dari populasi.
- Jumlah Sampel: Jumlah individu yang termasuk dalam sampel.
2. Berbagai Jalur Pengumpulan Data
Selain melalui langsungpenyelidikan(— seperti sensus penduduk—) untuk mendapatkan data, kita juga bisa melalui:
- Eksperimen: Dalam statistika, ilmu merancang eksperimen disebut 'Desain Eksperimen'.
- Pengamatan: Mengumpulkan informasi dalam keadaan alami.
- Pencarian: Mendapatkan data yang sudah dikumpulkan oleh orang terdahulu, data ini disebutdata sekunder.
Sampel memiliki sifat acak, sehingga ketika menggunakan sampel untuk memperkirakan populasi, kesimpulan statistik yang dihasilkan memilikikemungkinan(— artinya mungkin terjadi kesalahan—), hal ini perlu diperhatikan saat menggunakan hasil statistik untuk menjelaskan masalah nyata.
Rumus Proporsi: $\frac{n}{N} = \frac{\text{Jumlah Sampel Lapisan}}{\text{Jumlah Populasi Setiap Lapisan}}$
1. 收集多项式各项:一个 x² 正方形,三个 x 矩形条,以及两个 1x1 单位正方形。
2. Mulailah menyusunnya secara geometris.
3. Mereka membentuk persegi panjang besar yang utuh! Lebarnya adalah (x+2), tingginya adalah (x+1).
PERTANYAAN 1
Untuk memahami nilai 5.000 siswa dari suatu daerah yang mengikuti tes kompetensi komputer, 200 siswa dipilih secara acak untuk diselidiki dan dianalisis. Dalam kasus ini, 200 siswa yang dipilih adalah ( ).
A. Populasi
B. Individu
C. Sampel
D. Jumlah Sampel
Benar! Populasi adalah nilai dari 5.000 siswa, sedangkan nilai dari 200 siswa yang dipilih membentuk sebuah sampel.
Salah. 200 siswa merupakan subset populasi, yaitu sampel. Jumlah sampel merujuk pada angka konkret 200.
PERTANYAAN 2
Sebuah perusahaan memiliki total $N$ karyawan, terbagi dalam beberapa departemen. Untuk melakukan pengambilan sampel acak berlapis dengan proporsi ukuran sampel, dari seluruh karyawan harus diambil sampel berjumlah $n$. Jika suatu departemen memiliki $m$ karyawan, maka jumlah karyawan yang harus diambil dari departemen ini adalah ( ).
$\frac{m}{n} \cdot N$
$\frac{n}{N} \cdot m$
$\frac{m}{N} \cdot m$
$n - m$
Benar! Berdasarkan prinsip alokasi proporsional dalam pengambilan sampel acak berlapis, rasio pengambilan sampel adalah $\frac{n}{N}$, sehingga jumlah yang harus diambil dari departemen ini adalah $m \times \frac{n}{N}$.
Salah. Pengambilan sampel acak berlapis harus menjaga rasio pengambilan sampel dalam setiap lapisan tetap sama dengan rasio pengambilan sampel secara keseluruhan, yaitu $\frac{\text{Jumlah Sampel Lapisan}}{m} = \frac{n}{N}$.
PERTANYAAN 3
Di antara penyelidikan berikut, mana yang paling sesuai dilakukan dengan metode penyelidikan sampel ( )?
Menyelidiki luas lahan tanaman padi di setiap desa di sebuah kabupaten
Memahami tingkat perkecambahan benih jagung dalam sekelompok benih
Perusahaan tertentu menyelidiki formulir pemeriksaan kesehatan karyawannya
Sensus penglihatan siswa di sebuah kelas
Benar! Mengetahui tingkat perkecambahan benih jagung bersifat merusak, sehingga tidak mungkin dilakukan penyelidikan komprehensif, dan harus menggunakan penyelidikan sampel.
Salah. Jika penyelidikan bersifat merusak (seperti tingkat perkecambahan benih atau umur lampu) atau populasi terlalu besar, maka metode penyelidikan sampel lebih tepat digunakan.
PERTANYAAN 4
Departemen kesehatan publik suatu wilayah menyelidiki kebiasaan merokok pada 200 siswa, 58 orang menjawab 'ya'. Bisakah Anda memperkirakan persentase siswa perokok di wilayah tersebut?
29%
58%
20%
Tidak dapat diperkirakan
Benar! Gunakan frekuensi sampel untuk memperkirakan persentase populasi: $58 \div 200 = 0.29 = 29\%$.
Salah. Frekuensi harus dihitung dengan membagi jumlah frekuensi sampel dengan jumlah sampel, lalu gunakan hasil tersebut untuk memperkirakan proporsi populasi.
PERTANYAAN 5
Perbedaan utama antara pengambilan sampel acak sederhana dan pengambilan sampel acak berlapis adalah ( ).
Ukuran jumlah sampel berbeda
Apakah setiap individu memiliki peluang yang sama untuk masuk ke dalam sampel
Apakah pengambilan sampel dilakukan berdasarkan perbedaan individu
Metode pengolahan data sangat berbeda
Benar! Pengambilan sampel acak berlapis cocok untuk situasi di mana perbedaan dalam populasi sangat jelas, karena pembagian lapisan membantu mengurangi kesalahan sampling.
Perhatian: Dalam kedua metode, setiap individu memiliki peluang yang sama untuk dipilih. Perbedaannya terletak pada fakta bahwa pengambilan sampel acak berlapis menggunakan informasi tambahan dari populasi (perbedaan lapisan).
PERTANYAAN 6
对于 $m$ 个数据 $x_i$ 平均数为 $\bar{x}$,$n$ 个数据 $y_j$ 平均数为 $\bar{y}$,组合后的总平均数公式正确的是 ( )。
$\frac{\bar{x} + \bar{y}}{2}$
$\frac{m\bar{x} + n\bar{y}}{m+n}$
$\frac{\bar{x} + \bar{y}}{m+n}$
$\frac{m+n}{\bar{x} + \bar{y}}$
Benar! Ini adalah konsep rata-rata tertimbang, dan juga merupakan rumus inti untuk memperkirakan rata-rata total dalam pengambilan sampel acak berlapis.
Salah. Tidak boleh langsung menjumlahkan rata-rata dan dibagi dua; harus mempertimbangkan jumlah sampel (berat) dari setiap kelompok data.
PERTANYAAN 7
Mengenai 'kemungkinan' dalam penyelidikan sampel, pernyataan berikut yang benar adalah ( ).
Asalkan metodanya ilmiah, kesimpulannya adalah kebenaran mutlak
Hasil penyelidikan sampel tidak memiliki nilai referensi apa pun
Kesimpulan didasarkan pada inferensi dari sampel, dan memiliki risiko acak
Hasil sensus juga bisa menghasilkan kesalahan kemungkinan
Benar! Hasil inferensi statistik memiliki kemungkinan karena pemilihan sampel bersifat acak.
Salah. Kemungkinan adalah sifat inheren statistika, yang berarti hasil memiliki probabilitas tertentu bukan kepastian.
PERTANYAAN 8
Jalur penyelidikan berikut yang termasuk mendapatkan 'data sekunder' adalah ( ).
Mengukur hasil lari 100 meter siswa secara langsung di pelajaran olahraga
Mencari data penduduk dalam 'Statistical Yearbook' di perpustakaan
Merancang kuesioner untuk menyelidiki kebiasaan belanja orang-orang di jalan
Mencatat waktu reaksi melalui eksperimen kimia
Benar! Mengakses data yang telah dikumpulkan dan dirangkum oleh orang lain adalah mendapatkan data sekunder.
Salah. Data sekunder adalah data yang tidak diperoleh langsung oleh peneliti melalui observasi atau eksperimen asli.
PERTANYAAN 9
Dalam pengambilan sampel acak berlapis, jika ukuran populasi adalah 1000, ukuran sampel adalah 100, dan suatu lapisan memiliki 250 individu, maka jumlah individu yang harus diambil dari lapisan ini adalah ( ).
10
25
50
100
Benar! Rasio pengambilan sampel adalah $100/1000 = 0.1$, sehingga lapisan ini harus mengambil $250 \times 0.1 = 25$ individu.
Salah. Gunakan rumus proporsi: Jumlah Sampel Lapisan = (Jumlah Sampel / Jumlah Populasi) × Jumlah Populasi Lapisan.
PERTANYAAN 10
Dalam pengambilan sampel acak sederhana, peluang setiap individu masuk ke sampel adalah ( ).
1
$n/N$
$1/n$
$1/N$
Benar! Dalam pengambilan sampel acak sederhana dengan ukuran sampel $n$ dan ukuran populasi $N$, peluang setiap individu terpilih adalah $n/N$.
Salah. Meskipun merupakan pengambilan sampel acak, peluang setiap individu terpilih bergantung pada rasio ukuran sampel terhadap ukuran populasi.
Tantangan: Desain Rencana Statistik dan Inferensi
Bacaan Materi:Pemerintah kota berencana menerapkan tarif listrik bertingkat, menentukan standar berdasarkan data sampel dari 200 rumah tangga (rentang 50~350 kWh). Tujuannya adalah agar 75% penduduk berada di tingkat pertama, 20% di tingkat kedua, dan sisanya 5% di tingkat ketiga.
1. [Jawaban Singkat] Buktikan rumus rata-rata total dalam pengambilan sampel acak berlapis: $\frac{\sum_{i=1}^m x_i + \sum_{j=1}^n y_j}{m+n} = \frac{m}{m+n}\bar{x} + \frac{n}{m+n}\bar{y}$
Bukti: Berdasarkan definisi rata-rata, diketahui bahwa $\sum_{i=1}^m x_i = m\bar{x}$ dan $\sum_{j=1}^n y_j = n\bar{y}$.
Substitusi ke pembilang ruas kiri:
Ruas kiri $= \frac{m\bar{x} + n\bar{y}}{m+n} = \frac{m\bar{x}}{m+n} + \frac{n\bar{y}}{m+n} = \frac{m}{m+n}\bar{x} + \frac{n}{m+n}\bar{y}$.
Terbukti. Rumus ini menunjukkan bahwa rata-rata total adalah rata-rata tertimbang dari rata-rata setiap lapisan.
Substitusi ke pembilang ruas kiri:
Ruas kiri $= \frac{m\bar{x} + n\bar{y}}{m+n} = \frac{m\bar{x}}{m+n} + \frac{n\bar{y}}{m+n} = \frac{m}{m+n}\bar{x} + \frac{n}{m+n}\bar{y}$.
Terbukti. Rumus ini menunjukkan bahwa rata-rata total adalah rata-rata tertimbang dari rata-rata setiap lapisan.
2. [Tugas Menulis] Buatlah rencana untuk penyelidikan berat badan siswa seluruh sekolah (sekitar 500 kata).
Poin-poin Rencana Contoh:
1. Tentukan tujuan: Memahami rata-rata berat badan dan distribusi obesitas siswa seluruh sekolah.
2. Tentukan populasi dan individu: Semua siswa di sekolah merupakan populasi, setiap siswa merupakan individu.
3. Pilih metode pengambilan sampel: Mengingat perbedaan perkembangan antara tingkat kelas dan jenis kelamin yang signifikan, disarankan untuk menggunakanpengambilan sampel acak berlapis. Gunakan tingkat kelas (kelas X, XI, XII) dan jenis kelamin sebagai kriteria pembagian lapisan.
4. Tentukan ukuran sampel: Berdasarkan biaya tenaga kerja, pilih 10% siswa (misalnya 300 orang).
5. Laksanakan pengumpulan data: Gunakan metode pengukuran langsung (catatan timbangan), bukan jawaban sendiri (data sekunder mungkin mengandung bias).
6. Analisis dan inferensi: Hitung rata-rata dan simpangan baku sampel, gambar histogram distribusi frekuensi, dan tentukan standar 'kegemukan' berdasarkan persentil.
1. Tentukan tujuan: Memahami rata-rata berat badan dan distribusi obesitas siswa seluruh sekolah.
2. Tentukan populasi dan individu: Semua siswa di sekolah merupakan populasi, setiap siswa merupakan individu.
3. Pilih metode pengambilan sampel: Mengingat perbedaan perkembangan antara tingkat kelas dan jenis kelamin yang signifikan, disarankan untuk menggunakanpengambilan sampel acak berlapis. Gunakan tingkat kelas (kelas X, XI, XII) dan jenis kelamin sebagai kriteria pembagian lapisan.
4. Tentukan ukuran sampel: Berdasarkan biaya tenaga kerja, pilih 10% siswa (misalnya 300 orang).
5. Laksanakan pengumpulan data: Gunakan metode pengukuran langsung (catatan timbangan), bukan jawaban sendiri (data sekunder mungkin mengandung bias).
6. Analisis dan inferensi: Hitung rata-rata dan simpangan baku sampel, gambar histogram distribusi frekuensi, dan tentukan standar 'kegemukan' berdasarkan persentil.
3. [Jawaban Singkat] Seseorang berkata: "Penyelidikan sampel lebih hemat tenaga dan sumber daya daripada sensus, dan hasilnya hampir sama, sehingga penyelidikan sampel selalu lebih baik." Apakah Anda setuju dengan pernyataan ini?
Jawaban Referensi:
Pernyataan ini memiliki dasar logis, namun terlalu absolut.
(1) Keunggulan: Penyelidikan sampel memang efisien secara ekonomi dan cepat, serta menjadi satu-satunya pilihan ketika penyelidikan bersifat merusak (seperti uji perkecambahan biji) atau populasi tak terbatas.
(2) Keterbatasan: Penyelidikan sampel memiliki kesalahan sampling, sehingga kesimpulannya bersifat 'kemungkinan'. Untuk kebutuhan akurasi tinggi, keputusan penting nasional (seperti sensus penduduk), atau kewajiban hukum yang mensyaratkan cakupan penuh, sensus tetap tidak tergantikan.
(3) Kesimpulan: Harus memilih secara fleksibel berdasarkan tujuan penyelidikan, biaya, dan ukuran populasi.
Pernyataan ini memiliki dasar logis, namun terlalu absolut.
(1) Keunggulan: Penyelidikan sampel memang efisien secara ekonomi dan cepat, serta menjadi satu-satunya pilihan ketika penyelidikan bersifat merusak (seperti uji perkecambahan biji) atau populasi tak terbatas.
(2) Keterbatasan: Penyelidikan sampel memiliki kesalahan sampling, sehingga kesimpulannya bersifat 'kemungkinan'. Untuk kebutuhan akurasi tinggi, keputusan penting nasional (seperti sensus penduduk), atau kewajiban hukum yang mensyaratkan cakupan penuh, sensus tetap tidak tergantikan.
(3) Kesimpulan: Harus memilih secara fleksibel berdasarkan tujuan penyelidikan, biaya, dan ukuran populasi.
✨ Poin Utama
Populasi individuJelas terpisah,Pengambilan sampel acakMenjaga keadilan.Proporsi berlapisTidak boleh salah,Estimasi sampelBerisi kemungkinan!
💡 Poin Kunci Berlapis
Inti dari pengambilan sampel acak berlapis adalah perbedaan individu dalam lapisan kecil, sedangkan perbedaan antar lapisan besar.
💡 Perhatian Ukuran Sampel
Semakin besar ukuran sampel $n$, semakin kecil kesalahan sampling biasanya, namun biayanya juga meningkat.
💡 Sensus vs Sampel
Eksperimen yang merusak (seperti umur lampu atau tingkat perkecambahan pangan) tidak boleh dilakukan dengan penyelidikan komprehensif.
💡 Pembersihan Data
Setelah mendapatkan data sekunder, harus memeriksa apakah sumbernya otoritatif dan seberapa aktual datanya, serta melakukan pembersihan data yang diperlukan.
💡 Pemahaman Kemungkinan
Perkiraan 'tingkat perokok 29% di wilayah ini' dari sampel adalah nilai estimasi, bukan berarti populasi pasti 29%.